Ibuki Kuroyanagi
2022-03-16はじめまして、名古屋大学大学院情報学研究科修士1年の畔栁伊吹です。2021年の夏にLINEのAI開発室のリサーチャーインターンシップに6週間参加しました。今回のインターンはコロナの影響でフルリモートで参加しました。普段と異なる環境かつ限られた時間の中で成果を出せるか不安でしたが、メンターの方と毎日30分程度ミーティングの時間があったため、問題なく進めることができました。
インターンでは、「汎用的な音声表現のための複数のサンプリング戦略を用いた自己教師あり学習法」の開発、実験、論文執筆を行いました。論文は音声・音響・信号処理分野における世界最大規模の国際学会ICASSP2022に投稿し、採択されました[1]。以下では、インターンで取り組んだ研究の概要について書きます。
研究背景
音に関連するタスクには、音声認識、話者識別、コマンド認識、音響イベント検出、ピッチ推定、など様々な種類があります。ニューラルネットワークの発展に伴い様々な手法が高い性能を実現していますが、それぞれのタスクに対して専用の学習用データを収集し、教師ラベルを付与 する必要があるため多くの労力が必要となります。コマンド認識